visionagents

VisionAgents 开源视频AI框架

在这个逐步快速入门指南中,我们将使用 Vision Agents,构建并运行一个 实时语音 AI 代理,该代理可以加入视频/音频通话,通过语音与用户互动,并使用 Google 的 Gemini 音频生成模型 进行响应。

视频 gemini 开源 llm visionagents 2025-10-25 12:00  1